期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于主成分分析和 K近邻的文件类型识别算法
鄢梦迪, 秦琳琳, 吴刚
计算机应用    2016, 36 (11): 3161-3164.   DOI: 10.11772/j.issn.1001-9081.2016.11.3161
摘要585)      PDF (583KB)(481)    收藏
为解决基于文件后缀名和文件特征标识识别文件类型误判率较高的问题,在基于文件内容识别文件类型的算法基础上,提出主成分分析(PCA)和 K近邻( KNN)算法相结合的文件类型识别算法。首先,使用PCA方法对样本预处理以降低样本空间的维数;然后,对降维后的训练样本集进行聚类处理,即用聚类质心代表每种类型的文件;最后,针对训练样本分布不均匀可能造成的分类误差,提出基于距离加权的 KNN算法。实验结果表明,改进算法在样本数较多的情况下,能降低分类的计算复杂度,并保持了较高的识别正确率;而且该算法不依赖文件类型的特征标识,应用范围更为广泛。
参考文献 | 相关文章 | 多维度评价
2. 基于指代消解的中文事件融合方法
许荣华 吴刚 李培峰 朱巧明
计算机应用    2009, 29 (08): 2264-2267.  
摘要1156)      PDF (644KB)(1142)    收藏
事件抽取是信息抽取领域的一个重要的研究方向。针对事件抽取获得的信息不完整和语义不明确的特点,在此基础上引入指代消解和信息融合理论,通过事件元素归一化和互指事件的合并,在数据和特征两个层次上对事件信息进行融合,进一步明确和完善事件信息,并在不损失信息的情况下精简整个信息系统的信息量。在裁员事件的融合实验中正确率达到86.9%。
相关文章 | 多维度评价
3. 一种广播数据系统数据帧同步快速算法
赵兵选 吴刚 吕旭涛 王嵩
计算机应用   
摘要1387)      PDF (448KB)(1127)    收藏
广播数据系统接收机在开机后或者经过长时间信号衰减后必须迅速获得同步。传统的标准算法利用接收到的数据序列与校验矩阵相乘来验证是否同步,速度较慢。提出了一种基于查表法的数据帧同步快速算法,将接收到的二进制数据序列与校验矩阵的乘积(模二)问题转化为3字节求余式问题,通过查余式表判断接收机是否达到同步,较大地提高了速度,并显著降低了所需的存储空间。仿真结果表明了该算法的快速性和有效性。
相关文章 | 多维度评价